Transisi dasar dalam komputasi berkinerja tinggi melibatkan perpindahan dari model eksekusi serial berbasis CPU ke model produsen-konsumen terpisah di mana CPU mengelola pipa sedangkan GPU beroperasi secara mandiri. Realisasi utama adalah bahwa GPU tidak dimaksudkan untuk dikendalikan sebagai perangkat sinkron yang ketat; menanganinya demikian menciptakan bottleneck "berhenti-dan-menunggu".
1. Siklus Kehidupan Kerja
Dalam pola pikir asinkron, pengembang tidak menunggu setiap tugas selesai. Sebaliknya, mereka mengalokasikan memori, meluncurkan kernel, dan menyalin kembali hasil dengan menempatkan permintaan non-blokir ke dalam antrian perangkat keras.
2. Mengatasi Hambatan
Ketika host dipaksa untuk mensinkronkan setelah setiap operasi, jeda eksekusi—waktu tempuh antara CPU dan GPU—mendominasi kinerja. Dengan memanfaatkan Asinkronisme, CPU terus berkerja sementara GPU memproses aliran-nya, memaksimalkan saturasi perangkat keras.
$$\text{Waktu Total} = \max(\text{Kerja CPU}, \text{Kerja GPU}) + \text{Overhead Sinkronisasi}$$